- JEUX (THÉORIE DES)
- JEUX (THÉORIE DES)La théorie des jeux est, parmi les techniques de la recherche opérationnelle, celle qui s’occupe spécialement des situations dans lesquelles plusieurs personnes ont à prendre des décisions dont dépend un résultat qui les concerne. Les diverses techniques d’analyse scientifique des décisions peuvent intervenir simultanément dans un problème, mais on dit qu’il s’agit d’un problème de jeu lorsque sa difficulté est particulièrement liée à la présence de plusieurs centres de décision. Il en est souvent ainsi dans les problèmes économiques, politiques, diplomatiques, militaires.Dans une telle situation, il y a place pour deux facteurs essentiels, la coopération et la lutte . Il est clair, en effet, que les personnes en présence, les joueurs , ont des intérêts qui peuvent concorder sur certains terrains et s’opposer sur d’autres. On peut distinguer trois classes de jeux, selon le rôle qu’y jouent la coopération et la lutte.Dans les jeux de coopération à l’état pur , tous les joueurs ont des intérêts concordants, de sorte qu’ils forment une coalition se comportant comme un joueur unique. L’étude de leurs décisions relève donc plutôt de la théorie des programmes. Cependant l’étude des conditions dans lesquelles il est possible de dégager un intérêt général auquel puisse se rallier un ensemble de joueurs relève de la théorie des jeux: c’est le problème de l’agrégation des préférences individuelles, qui éclaire celui de la formation des alliances.Dans les jeux de lutte à l’état pur , aucune possibilité de coopération n’existe entre les joueurs. Il en résulte que ces jeux sont des duels , c’est-à-dire des jeux à deux joueurs dont les intérêts sont strictement opposés (two-person zero-sum games ). Bien que deux joueurs engagés dans un conflit s’opposent rarement sur tous les terrains, l’étude du duel est indispensable, non seulement parce qu’elle peut tout de même s’appliquer à certains conflits bien délimités où le rôle de la coopération est négligeable, mais aussi parce qu’elle contribue à l’étude des jeux plus généraux, à l’intérieur desquels il est souvent utile de considérer la possibilité de certains duels entre deux coalitions complémentaires. La théorie du duel cherche à mettre en évidence un ou plusieurs résultats privilégiés selon certains points de vue (prudence ou équilibre) pour l’un et l’autre joueurs. C’est la partie la plus achevée de la théorie des jeux.Dans les jeux de lutte et de coopération se rencontrent simultanément des intérêts concordants et des intérêts divergents. Ces jeux se prêtent mieux que les duels à la représentation des situations réelles, mais il est plus difficile de les étudier systématiquement en raison de la variété des aspects que peut prendre la coopération, selon les modalités de la communication entre les joueurs et les possibilités de formation et d’évolution des alliances (il s’agit de véritables conditions sociologiques). La théorie des jeux de lutte et de coopération propose plusieurs points de vue pour l’analyse de ces jeux (rationalité et stabilité par exemple), et, faute de pouvoir en général isoler des résultats privilégiés, elle cherche à mettre en évidence des classes de résultats, privilégiées en tant que classes selon ces points de vue. Mais cette théorie ne peut présenter la même unité que la théorie du duel.Pour aborder un problème de jeu, il faut d’abord construire un modèle , représentant plus ou moins fidèlement la situation réelle. L’étude de ce modèle, selon les méthodes de la théorie des jeux, peut avoir pour objet, soit de guider les joueurs dans leur manière de jouer effectivement le jeu, soit de les aider à atteindre, par marchandage ou par arbitrage, une solution de compromis qui tienne compte de leurs moyens d’action et de leurs intérêts respectifs, soit enfin d’expliquer l’évolution d’une situation concrète par référence à des principes «unificateurs» d’une portée plus générale.1. Construction des modèles de jeuxSchéma de causalité. Schéma de finalitéDans tout problème de jeu, et plus généralement dans tout problème de décision, l’analyse de la situation concrète suit toujours les mêmes étapes, pour aboutir à la construction d’un modèle représentatif qui se prête au moins à une réflexion méthodique, et si possible à une étude mathématique.Celui qui, dans un jeu, va prendre une décision doit d’abord chercher à décrire soigneusement l’ensemble des possibilités qui lui sont offertes, mais aussi chercher à se faire une idée précise des possibilités offertes aux autres joueurs, adversaires ou non. Il lui faut ensuite examiner les conséquences, certaines ou aléatoires, attachées à tous les systèmes possibles de décisions prises par tous les joueurs. Car ces conséquences ne dépendent pas seulement des décisions d’une personne, et c’est ce qui fait la spécificité et la difficulté des problèmes de jeu. Ces deux étapes établissent le schéma de causalité du jeu, dont on peut dire qu’il constitue la règle du jeu considéré.Il importe d’observer que chacun des joueurs peut envisager, non seulement de choisir délibérément l’une des tactiques dont il dispose, mais encore de procéder à un tirage au sort entre ces tactiques en choisissant une distribution de probabilité sur leur ensemble. Cela revient à remplacer l’ensemble des tactiques (pure strategies ) de chaque joueur par l’ensemble plus riche de ses stratégies (mixed strategies ). Les conséquences attachées aux systèmes de stratégies sont alors nécessairement aléatoires. (Il faut remarquer, avec Émile Borel, que les probabilités sont utilisées dans les stratégies comme instrument de décision et d’action, pour traduire les variations potentielles de la tactique d’un joueur.)Afin de guider son choix, chaque joueur doit ensuite établir un ordre de préférence sur l’ensemble des conséquences, certaines ou aléatoires, mises en évidence par le schéma de causalité. Mais il doit aussi chercher à se faire une idée précise des ordres de préférence des autres joueurs sur ce même ensemble de conséquences. C’est ce que l’on appelle établir le schéma de finalité du jeu, et cela revient le plus souvent à construire un indicateur de préférence – ou indicateur d’utilité – pour chacun des joueurs. Cette tâche est en général délicate, car les conséquences à comparer peuvent être fort complexes (mettant en jeu, par exemple, des vies humaines ou des considérations morales en même temps que des biens matériels) et elles sont souvent aléatoires.On suppose en général, dans les jeux stratégiques, que les préférences des joueurs peuvent être traduites par des indicateurs d’utilité linéaire , c’est-à-dire des indicateurs numériques dont les valeurs puissent être calculées par des opérations de moyenne en probabilité. C’est l’hypothèse de Daniel Bernoulli, équivalente à l’axiomatique de von Neumann et Morgenstern. Cependant la construction d’un tel indicateur d’utilité dans le jeu stratégique ne résulte pas immédiatement de la connaissance d’un indicateur de préférence dans le jeu tactique, et il peut même arriver que le passage du jeu tactique au jeu stratégique pose des problèmes psychologiques difficiles.Enfin, malgré le caractère schématique de cette hypothèse, les modèles usuels de jeux supposent, le plus souvent, par souci de simplification, que les possibilités et les préférences de chaque joueur sont connues de tous les autres.Alliances et agrégation des préférences individuellesDans les situations réelles de conflit, où il y a place à la fois pour la lutte et pour la coopération, certains joueurs peuvent être amenés à mettre en commun leurs moyens d’action au service d’une finalité collective, c’est-à-dire à conclure une alliance , ou coalition .Dans ces conditions, l’établissement du schéma de causalité, c’est-à-dire la description de toutes les possibilités offertes aux joueurs pour agir isolément ou pour conclure des alliances, et l’examen des conséquences qui peuvent résulter de leurs décisions exigent une analyse qui risque d’être très complexe. Mais c’est dans l’établissement du schéma de finalité que se présentent les difficultés les plus profondes, tout au moins si l’on cherche à construire les préférences collectives des alliances à partir des préférences individuelles des joueurs. Il s’agit de la théorie de l’agrégation des préférences individuelles, ou théorie de l’utilité collective.Quand l’ensemble des résultats possibles est un ensemble de situations aléatoires sur lequel les préférences des différents joueurs peuvent être représentées par des indicateurs d’utilité linéaire, il est naturel de chercher à représenter de la même façon les préférences collectives des alliances envisagées. Alors, si l’indifférence unanime des membres d’une alliance entre deux résultats quelconques implique l’indifférence de l’alliance, l’indicateur d’utilité collective se déduit nécessairement des indicateurs d’utilité individuelle par combinaison linéaire. Mais le choix des coefficients intervenant dans une telle combinaison pose un problème délicat, et l’existence d’un indicateur d’utilité linéaire représentant les préférences d’une collectivité est une hypothèse très restrictive.Quand les opinions individuelles s’expriment seulement par des ordres de préférence sur un ensemble fini de résultats, la recherche d’une règle d’agrégation permettant d’en déduire une opinion collective de même forme se heurte à des difficultés logiques que Condorcet a été le premier à mettre en évidence à propos du fonctionnement des assemblées où sont mises en œuvre des procédures de vote majoritaires. Le phénomène essentiel, auquel on peut donner le nom d’effet Condorcet , est le suivant: si l’on convient d’appeler cohérent tout système de préférences binaires «transitives» c’est-à-dire excluant les cycles tels que «x préféré à y , y préféré à z , z préféré à x », alors la cohérence des préférences individuelles n’implique pas celle des préférences collectives qui s’en déduisent par une règle majoritaire d’agrégation des préférences binaires.Des résultats plus généraux sont donnés par le théorème d’Arrow et différents théorèmes complémentaires, qui expriment rigoureusement un fait que le sens commun révèle et que l’expérience confirme: lorsque les opinions individuelles sont trop discordantes, lorsqu’il n’existe aucun principe objectif dont elles doivent tenir compte, il est à craindre qu’on ne puisse d’aucune manière en dégager une opinion cohérente qui soit vraiment collective. On risque alors d’être enfermé dans l’alternative: accepter l’arbitrage d’un «dictateur», ou se résoudre, faute de jugement de valeur collectif, à une action collective où la lutte jouera un rôle essentiel. Au contraire, si certains principes imposent à l’ensemble des opinions individuelles une sorte d’harmonie interne, il devient possible d’en dégager une opinion collective cohérente par une procédure d’agrégation non dictatoriale (telle que la procédure majoritaire de Condorcet). Mais le choix de cette procédure joue un rôle primordial dans le résultat obtenu.Il est clair que la théorie de l’agrégation des préférences individuelles est l’un des instruments nécessaires pour aborder la difficile question de la formation et du fonctionnement des alliances. Le fait qu’une telle agrégation ne soit pas toujours possible montre de plus le caractère irréductible et spécifique de certaines situations de conflit .Forme développée et forme normale d’un jeuUn même modèle de jeu peut souvent être présenté sous plusieurs formes, qu’il est parfois utile de considérer simultanément, ou parmi lesquelles il faut s’efforcer de choisir celle qui se prêtera le mieux à l’étude ultérieure. Les deux formes types sont la forme développée et la forme normale.Il est fréquent que, dans le déroulement d’une partie, les joueurs aient à prendre une suite de décisions élémentaires , enchaînées entre elles par l’information dont dispose à chaque coup le joueur qui a le «trait» (les jeux de société, tels que les dames ou les échecs, le bridge ou le poker, donnent des exemples familiers de ces jeux, dits séquentiels). Si l’on explicite, dans le modèle d’un tel jeu, la succession et l’enchaînement des décisions élémentaires à prendre par les joueurs, on considère la forme développée du jeu, et le modèle est alors souvent présenté sous la forme d’un graphe particulier, connexe et dépourvu de cycles, appelé arbre du jeu . Les sommets de l’arbre représentent les différents coups possibles, personnels ou aléatoires; les branches partant d’un sommet représentent les diverses possibilités offertes au joueur qui a le trait, ou soumises à un tirage au sort dont les probabilités sont alors inscrites sur les branches correspondantes; et l’on fait figurer dans l’arbre des contours fermés entourant certains sommets pour représenter les ensembles d’information , dont les éléments sont des coups indiscernables entre eux pour le joueur qui a le trait. Si aucun ensemble d’information ne comprend plus d’un élément, le jeu est dit «à information parfaite» (tel est le cas du jeu de dames et du jeu d’échecs).Malgré la grande diversité des arbres de jeux, il est toujours possible de passer de la forme développée d’un jeu à une forme théoriquement plus simple, et d’une portée plus générale, qui est la forme normale du jeu. On ne cherche plus alors à expliciter la succession et l’enchaînement des décisions élémentaires, mais on représente le système de toutes les décisions élémentaires appartenant à chacun des joueurs par une décision globale unique, qui est le choix d’une tactique dans un ensemble pouvant être considéré comme le produit cartésien de tous les ensembles de possibilités offerts au joueur considéré dans tous les choix élémentaires dont il dispose. Choisir une tactique revient ainsi, pour un joueur, à prendre globalement, avant de se mettre au jeu, toutes les décisions élémentaires qu’il pourrait être amené à prendre au cours du jeu (mais qu’il n’aura pas en fait à prendre toutes au cours d’une partie). On peut se représenter le choix d’une tactique comme la rédaction des consignes données par un joueur à un mandataire chargé de le représenter au cours de la partie: ces consignes doivent être complètes en ce sens que, quel que soit le déroulement de la partie, le mandataire doit pouvoir se contenter de les appliquer sans prendre aucune initiative personnelle (et l’on voit ainsi quelle peut être la complexité des tactiques).Dans le cas de jeux à n joueurs, le passage à la forme normale ramène le jeu à un jeu à n coups mutuellement indépendants: le choix d’une tactique par chacun des n joueurs. À chacun des systèmes possibles de n tactiques est attaché un résultat, en général aléatoire.2. Principes de l’étude des modèles de jeuxLes principaux moyens utilisés dans l’étude des modèles de jeux, qu’il s’agisse de duels ou de jeux plus généraux, peuvent se rattacher d’une manière plus ou moins immédiate aux quatre principes directeurs suivants: les calculs d’espérance, les considérations de dominance, la recherche de l’équilibre, le principe de récurrence.Calculs d’espérance. Stratégies prudentesQuand un joueur a choisi une stratégie, le résultat du jeu n’est pas déterminé, mais on peut associer à cette stratégie un ensemble de résultats qui restent possibles, compte tenu de toutes les stratégies dont disposent les autres joueurs. Tous ces résultats ont, pour le joueur considéré, une utilité au moins égale à un «minimum», ou plus généralement à un «infimum», qui est, par définition, l’espérance (security level ) relative à la stratégie en question pour ce joueur. Celui-ci peut ainsi attacher une espérance relative à chacune des stratégies dont il dispose, et s’intéresser, parmi toutes ses stratégies, à celles qui lui assurent l’espérance relative la meilleure et qui sont, par définition, ses stratégies prudentes (s’il en existe). L’espérance relative aux stratégies prudentes, ou plus généralement le «supremum» de toutes les espérances relatives, est, par définition, l’espérance (optimal security level ) du joueur considéré dans le jeu étudié. Cette espérance est donc, dans le cas général, le supremum d’un infimum. Dans le cas particulier où l’infimum et le supremum sont atteints, l’espérance ainsi définie est le maximum d’un minimum: c’est un « maximin ».Il est naturel de considérer comme prudent le joueur qui, en choisissant une stratégie prudente, s’assure autant qu’il le peut contre le pire. Mais cette recherche de la sécurité peut paraître excessive et commandée seulement par l’attitude trop pessimiste qui consiste à prévoir systématiquement le pire. Une telle critique est certainement fondée dans le cas général, et montre que les calculs d’espérance ne sauraient suffire à guider l’action des joueurs dans tous les cas. Ces calculs jouent cependant un rôle fondamental dans le cas particulier du duel, et ils fournissent toujours des renseignements importants dont il serait imprudent de ne pas tenir compte.Bien entendu, ce qui vient d’être dit de l’espérance d’un joueur s’applique aussi à l’espérance d’une alliance de joueurs, pourvu que l’on ait pu définir avec précision les stratégies dont dispose cette alliance et l’indicateur d’utilité qui traduit ses préférences collectives. Ce sont précisément les espérances de toutes les alliances possibles qui définissent la fonction caractéristique du jeu dans les problèmes de partage de von Neumann et Morgenstern. Des fonctions caractéristiques généralisées ont ensuite été définies pour d’autres modèles de jeux à n joueurs.Considérations de dominanceIl peut arriver qu’une certaine stratégie d’un joueur (pure ou mixte, selon les cas) conduise, pour toutes les stratégies des autres joueurs, à des résultats respectivement meilleurs – ou au moins aussi bons – pour lui que ceux auxquels conduirait une autre de ses stratégies. La première stratégie domine alors la seconde en ce sens que, quoi que fassent les autres joueurs, elle est toujours plus avantageuse (auquel cas la dominance est stricte ) – ou au moins aussi avantageuse (auquel cas la dominance est large ) – pour le joueur qui l’emploie.Un joueur agissant isolément ne peut manifestement rien perdre à choisir les stratégies dominantes plutôt que les stratégies dominées, et il peut au contraire y gagner quelque chose. Les autres joueurs peuvent donc raisonnablement penser qu’il renoncera à l’emploi des stratégies dominées, et ces considérations de logique très élémentaire permettent parfois de remplacer l’étude du jeu considéré par celle d’un jeu plus simple en faisant abstraction des stratégies dominées des différents joueurs. On peut même, dans certains cas, réduire à nouveau, de manière analogue, le jeu ainsi obtenu, et poursuivre ce processus de réductions successives aussi longtemps qu’il est efficace, bien qu’il soit plus difficile en général de donner une justification satisfaisante d’une telle itération.Des considérations analogues de dominance collective peuvent s’appliquer aux stratégies des alliances de joueurs, pourvu que les préférences collectives correspondantes soient bien définies et qu’il s’agisse d’alliances solides, pratiquement contraignantes pour ceux qui les ont conclues. Dans le cas contraire, il se peut que l’«ascendant des intérêts particuliers» bloque la mise en œuvre des dominances collectives.Si l’on considère en particulier l’alliance hypothétique de tous les joueurs, on obtient une dominance entre résultats, et l’on est conduit à définir l’extremum de Pareto comme étant l’ensemble des résultats qu’il est impossible d’améliorer pour un joueur sans qu’un autre au moins en pâtisse (tout résultat non extrême, en ce sens, est manifestement dominé).Il y a lieu de rattacher aussi aux considérations de dominance collective les relations d’exclusion (ou de dominance) introduites par von Neumann et Morgenstern dans l’étude des problèmes de partage, et étendues ensuite à d’autres modèles de jeux à n joueurs (en particulier à certains modèles économiques).Recherche de l’équilibreOn dit qu’un système de n stratégies appartenant respectivement aux n joueurs est en équilibre – ou définit un point d’équilibre – si et seulement si chacune de ces stratégies est, pour le joueur qui l’emploie, l’une des meilleures réponses possibles au système des (n – 1) stratégies employées par les autres joueurs.Autrement dit, si les n joueurs ont choisi un système de n stratégies en équilibre et s’ils discutent ensuite la partie qu’ils ont jouée, chacun d’eux constate qu’il n’aurait pas pu mieux faire, compte tenu de ce qu’ont fait les autres. Si donc une nouvelle partie devait être jouée, aucun des joueurs ne serait incité par cette discussion à modifier sa manière de jouer. Il en résulte une certaine stabilité du résultat auquel ils sont alors parvenus. C’est pourquoi A. Cournot, qui fut sans doute le premier à introduire cette notion d’équilibre, plus tard réintroduite par J. F. Nash, donnait aux résultats correspondants le nom de situations définitives .Mais il est essentiel d’observer que l’intérêt ainsi compris des points d’équilibre est lié à l’hypothèse (explicite ou implicite) selon laquelle chaque joueur joue pour son propre compte sans pouvoir s’entendre avec les autres joueurs (et il ne suffit pas nécessairement, pour qu’il en soit ainsi, que les alliances soient interdites). C’est la raison pour laquelle la notion d’équilibre joue un rôle particulièrement important dans le cas du duel.Dans le cas d’un jeu où existent des possibilités de coopération, il ne suffit plus, pour définir un véritable équilibre, d’exiger qu’aucun joueur ne puisse à lui tout seul améliorer son sort. Il faudrait exiger de plus qu’aucune modification coordonnée réalisable des actions de plusieurs joueurs ne puisse leur permettre d’améliorer leurs sorts respectifs. La définition d’un tel équilibre au sens fort devient alors en général beaucoup plus délicate. Ce sont des considérations de ce genre qui conduisent en particulier à la théorie de la 祥-stabilité introduite par R. D. Luce.Contrairement à ce qui se passait pour la notion d’espérance, rien ne garantit l’existence ni l’unicité des équilibres dans un jeu déterminé, et il arrive en effet qu’il n’en existe aucun ou qu’il en existe plusieurs. L’une des tâches importantes de la théorie des jeux est de rechercher des équilibres et d’en prouver l’existence dans des classes de plus en plus générales de jeux. On conçoit d’ailleurs que la multiplicité des équilibres puisse, comme leur absence, poser des problèmes difficiles.Il y a lieu de rattacher à la recherche de l’équilibre les conditions de stabilité interne et de stabilité externe imposées aux ensembles de résultats qui constituent les «solutions» des problèmes de partage, au sens de von Neumann et Morgenstern.Remarque . Il est facile de montrer que tout point d’équilibre a , pour chacun des joueurs , une utilité au moins égale à son espérance . Mais il n’en résulte pas qu’un système de stratégies en équilibre soit un système de stratégies prudentes.Principe de récurrenceSi l’on considère un jeu sous forme développée, en s’intéressant à la succession et à l’enchaînement des coups, il est naturel de penser à l’étudier par une méthode d’analyse récurrente . Pascal a été l’initiateur de cette méthode dans les jeux de hasard pur, à propos du célèbre «problème des partis ». En supposant que le jeu soit représenté par un arbre fini, Pascal part des situations finales où le résultat est connu d’après la règle du jeu et, à l’aide d’un calcul récurrent de moyennes en probabilité, il remonte peu à peu dans l’arbre en attachant un indicateur d’utilité – qui est une espérance mathématique de gain – à chacune des situations intermédiaires et même à la situation initiale.Or une méthode récurrente analogue peut être appliquée, dans certains cas, aux jeux de stratégie sous forme développée, où le déroulement d’une partie fait intervenir non seulement des coups aléatoires, comme dans les jeux de hasard pur, mais aussi des coups personnels. Lorsqu’une telle analyse récurrente est possible, elle permet de remplacer l’étude globale des stratégies des joueurs (pures ou mixtes, selon les cas) par une suite d’études partielles portant sur leurs décisions élémentaires, ce qui présente l’avantage de fractionner les difficultés. Il faut encore partir des situations finales pour remonter peu à peu dans l’arbre du jeu, supposé fini, en appliquant pas à pas le principe d’optimalité , selon lequel chaque décision élémentaire doit être optimale, compte tenu de l’hypothèse selon laquelle toutes les décisions ultérieures seront, elles aussi, optimales. Mais le fait que toutes les décisions élémentaires n’appartiennent pas à un même joueur rend ici l’analyse difficile, en particulier parce que des situations équivalentes pour un joueur ne le sont pas nécessairement pour les autres.Dans le cas des jeux à information parfaite , où le joueur qui a le trait est toujours exactement informé du point où il se trouve dans l’arbre, la méthode récurrente permet de remonter de sommet en sommet immédiatement antérieur, et de calculer ainsi les espérances des joueurs en chaque sommet par des opérations de maximum et de minimum, et par des moyennes en probabilité s’il y a des coups aléatoires. Cette méthode permet aussi d’établir très simplement l’existence d’au moins un système de tactiques en équilibre dans tout jeu fini à information parfaite. Ce théorème de Kuhn est une généralisation du célèbre théorème de Zermelo-Kalmar, qui énonce la même propriété dans le cas particulier du duel.Dans le cas des jeux à information imparfaite , la présence d’ensembles d’information comprenant plusieurs sommets de l’arbre oppose des obstacles à la récurrence, qui doit alors franchir des pas plus grands au prix d’une analyse plus délicate. Mais il reste possible, dans certains cas, de remplacer l’étude globale du jeu considéré par une suite récurrente d’études partielles portant sur des sous-jeux représentés par certaines parties de l’arbre initial.Enfin lorsque les décisions élémentaires discrètes des jeux séquentiels sont remplacées par des décisions prises dans un ensemble continu, par exemple dans un déroulement continu du temps, on obtient le modèle des jeux différentiels , auxquels R. Isaacs s’est particulièrement intéressé, et dont l’étude peut parfois se rattacher au principe d’optimalité de Pontryagin comme celle des jeux séquentiels se rattache au principe d’optimalité de Bellman.3. Résultats de la théorie du duelUn duel est un jeu de lutte à l’état pur, c’est-à-dire un jeu à deux joueurs dont les intérêts sont strictement opposés. Dans un duel, un seul indicateur d’utilité suffit pour représenter les préférences opposées des deux joueurs A et B. On supposera que cet indicateur croît selon l’ordre des préférences croissantes de A et, par conséquent, selon l’ordre des préférences décroissantes de B. On dit alors que, par rapport à ces notations, A est le joueur du maximum et B est le joueur du minimum .Solutions d’un duel stratégique fini: stratégies optimales et valeur du jeuUn duel fini est un duel dans lequel chacun des deux adversaires A et B dispose d’un nombre fini de tactiques. On peut alors faire correspondre aux tactiques du joueur du maximum A les lignes d’un tableau , et aux tactiques du joueur du minimum B les colonnes de ce tableau, dont les cases correspondent ainsi aux différents couples de tactiques adverses, ou encore aux résultats qui leur sont attachés. On peut ensuite écrire dans chacune de ces cases la valeur de l’indicateur d’utilité commun aux deux joueurs pour le résultat correspondant. Le tableau rectangulaire ainsi construit représente la forme normale du duel considéré.1. Dans le duel tactique ainsi défini, l’espérance du joueur A est le maximum des minimums de lignes, c’est-à-dire le maximin , tandis que l’espérance du joueur B est le minimum des maximums de colonnes, c’est-àdire le minimax . Il est facile de montrer que le maximin est au plus égal au minimax, mais rien n’implique leur égalité dans le cas général. Cependant cette égalité est garantie par le théorème de Zermelo-Kalmar dans le cas des duels tactiques finis à information parfaite, comme le montre le principe de récurrence.Si le maximin est égal au minimax , leur valeur commune, qui est l’espérance commune aux deux adversaires, est appelée la valeur du jeu , et tout couple formé par une tactique prudente du joueur A et une tactique prudente du joueur B définit un équilibre . Réciproquement, tout couple de tactiques en équilibre est un couple de tactiques prudentes. Il en résulte que tous les points d’équilibre ont une utilité égale à la valeur du jeu, et que toute tactique de A entrant dans un équilibre définit encore un équilibre avec toute tactique de B entrant dans un équilibre. On exprime ces propriétés en disant que tous les équilibres d’un duel sont équivalents et interchangeables . Les tactiques prudentes, qui sont aussi les tactiques entrant dans les équilibres, sont dites optimales , et tout couple de tactiques optimales adverses définit, avec la valeur du jeu, une solution du duel tactique considéré (où le maximin est supposé égal au minimax). Chaque solution correspond ainsi à un point d’équilibre du jeu, ou encore à un col (saddle -point ) du tableau représentatif, c’est-à-dire à un élément qui est à la fois minimum dans sa ligne et maximum dans sa colonne, et tous ces cols sont égaux à la valeur du jeu.Si le maximin est strictement inférieur au minimax , il n’existe aucun couple de tactiques en équilibre ou, ce qui revient au même, il n’existe aucun col dans le tableau représentatif. Chaque joueur dispose encore d’au moins une tactique prudente, mais ces tactiques ne sont plus optimales et les résultats qui correspondent à leur emploi ne présentent plus aucun caractère de stabilité. La recherche de l’équilibre est alors vouée à l’échec dans le duel tactique.2. L’attrait de l’équilibre peut alors conduire les joueurs à plonger le duel tactique considéré dans un jeu stratégique plus vaste en envisageant de choisir des stratégies, c’est-à-dire des distributions de probabilité sur leurs ensembles de tactiques respectifs, et non plus seulement des tactiques. Ce passage du jeu tactique au jeu stratégique correspondant ne va pas de soi, et il exige de chaque joueur la construction d’un nouvel indicateur d’utilité. Si même chacun des deux adversaires du duel tactique parvient à construire un indicateur d’utilité linéaire pour passer au jeu stratégique, rien n’impose qu’ils adoptent la même attitude devant le risque, ni par conséquent que leurs préférences restent opposées sur les résultats aléatoires du jeu stratégique. Il est donc possible qu’un duel tactique conduise à un jeu stratégique qui ne soit pas un duel .Supposons cependant que le jeu stratégique ainsi obtenu reste un duel, et qu’un même indicateur d’utilité linéaire puisse traduire dans ce jeu les préférences opposées des deux joueurs. Cet indicateur est alors une fonction bilinéaire des probabilités distribuées par les deux adversaires sur leurs tactiques respectives (supposées en nombre fini), et l’on dit parfois que le duel considéré est un «jeu matriciel». Dans ces conditions, il est facile de reprendre pour le duel stratégique l’analyse esquissée plus haut pour le duel tactique. L’espérance du joueur du maximum A s’y présente de nouveau comme un maximin (stratégique), et l’espérance du joueur du minimum B comme un minimax (stratégique). Mais le fait essentiel, établi par le théorème fondamental de von Neumann (ou théorème de minimax), est que, dans tout duel stratégique fini, le maximin est égal au minimax , ou, autrement dit, les espérances des deux adversaires sont égales. Leur valeur commune est encore appelée la valeur du jeu (elle est toujours comprise entre le maximin tactique et le minimax tactique), et les couples de stratégies prudentes adverses se confondent avec les couples de stratégies en équilibre. Il en résulte que tous les équilibres d’un duel stratégique fini sont équivalents et interchangeables . Les stratégies prudentes, qui sont aussi les stratégies entrant dans les équilibres, sont dites optimales , et tout couple de stratégies optimales adverses définit, avec la valeur du jeu, une solution du duel stratégique considéré. Chaque solution correspond ainsi à un point d’équilibre du jeu, et tous ces points d’équilibre ont une même utilité égale à la valeur du jeu.Ainsi le théorème de von Neumann garantit non seulement l’existence d’un point d’équilibre au moins dans tout duel stratégique fini, mais encore l’équivalence et l’interchangeabilité de tous les équilibres qui peuvent y exister. C’est pourquoi l’éventuelle multiplicité des équilibres n’entraîne aucune difficulté supplémentaire dans le duel stratégique, où les stratégies optimales de chaque joueur peuvent être définies indépendamment de celles de son adversaire et sont toutes également efficaces contre elles. Ces importants résultats tiennent à la concordance qui existe ici entre la prudence des joueurs et la recherche de l’équilibre.3. Il importe de bien comprendre ce que signifie l’optimalité des stratégies figurant dans les solutions d’un duel. Ces stratégies assurent au moins son espérance, égale à la valeur du jeu, au joueur qui les emploie, et ce sont les meilleures stratégies possibles contre un adversaire qui «joue optimal», mais ce ne sont pas nécessairement les stratégies les plus avantageuses contre un adversaire qui «ne joue pas optimal». Cependant le joueur qui s’écarte de ses stratégies optimales, en supputant que son adversaire commettra telle ou telle «faute» et en s’efforçant d’en profiter au mieux, court le risque de tomber dans un piège habilement tendu et de se faire pénaliser. C’est pourquoi la théorie des jeux tient compte des possibilités et des préférences des joueurs plutôt que de leurs intentions.Bien entendu, les considérations de dominance peuvent être utilisées dans le duel stratégique. Mais, si aucune stratégie strictement dominée ne peut être optimale, il arrive que des dominances larges existent entre des stratégies optimales d’un même joueur. Il en est ainsi lorsqu’une stratégie optimale est plus avantageuse qu’une autre contre les stratégies non optimales de l’adversaire.Un caractère intéressant des stratégies optimales est qu’un joueur peut divulguer la stratégie optimale qu’il va employer (mais non pas la tactique résultant du tirage au sort effectué selon cette stratégie) sans que l’adversaire puisse en profiter pour améliorer son espérance. L’emploi d’une stratégie optimale protège donc efficacement le joueur contre la perspicacité de l’adversaire .4. La valeur d’un duel stratégique, espérance commune des deux joueurs, est en général l’utilité de certains résultats aléatoires (et, en particulier, de tous les points d’équilibre), mais il se peut qu’elle ne soit l’utilité d’aucun résultat concret effectivement réalisable à la fin d’une partie du jeu considéré, lorsque les tirages au sort commandés par les stratégies des joueurs auront été effectués. Cependant cette valeur du jeu, caractérisant le point d’affrontement des forces et des intérêts opposés des deux adversaires, présente une grande importance et elle pourrait fournir une base équitable pour construire une solution de compromis dans le cas où les joueurs auraient la possibilité et le désir de ne pas jouer effectivement le jeu.Résolution exacte ou approchée d’un duel stratégique finiRésoudre un duel, c’est déterminer sa valeur et les stratégies optimales des deux joueurs. Dans le cas d’un duel stratégique fini, cette résolution se ramène à celle d’un couple de programmes linéaires en dualité, dont la forme particulière garantit qu’ils admettent des solutions finies. Le théorème fondamental de von Neumann apparaît ainsi comme un cas particulier du théorème de dualité des programmes linéaires, selon lequel deux programmes en dualité admettent, s’ils sont tous les deux possibles, des optimums égaux.Le théorème de dualité a pour conséquence les importantes relations d’exclusion , qui peuvent s’énoncer de la façon suivante dans le cas particulier du duel. L’ensemble des tactiques essentielles d’un joueur, c’est-à-dire l’ensemble des tactiques figurant avec une probabilité non nulle dans l’une au moins de ses stratégies optimales, coïncide avec l’ensemble des tactiques qui donnent un résultat d’utilité égale à la valeur du jeu contre toute stratégie optimale de l’adversaire (ce qui n’implique pas que les tactiques essentielles soient elles-mêmes optimales). Ces relations donnent de précieux renseignements sur l’ensemble des stratégies optimales d’un joueur dès que l’on connaît une stratégie optimale de l’adversaire.La théorie des programmes linéaires montre que toutes les stratégies optimales d’un joueur peuvent s’obtenir par combinaison linéaire convexe à partir d’un nombre fini de stratégies optimales dites extrêmes . La détermination de ces stratégies optimales extrêmes et de la valeur du jeu peut être effectuée, pour des duels d’assez grande dimension (jusqu’à quelques centaines de tactiques), à l’aide des programmes de calcul électronique applicables aux programmes linéaires et utilisant sous diverses formes l’algorithme de Dantzig dit méthode du simplexe . Cette détermination peut aussi être effectuée à la main pour des duels de petite dimension.En pratique, il n’est pas toujours nécessaire de résoudre exactement un duel stratégique, c’est-à-dire de déterminer rigoureusement les équilibres équivalents et interchangeables dont l’existence est garantie par le théorème de von Neumann. Il est rare en effet qu’un modèle de duel représente rigoureusement une situation réelle de conflit, et que les valeurs de l’indicateur d’utilité employé puissent être considérées comme exactes. Il est alors inutile de chercher dans la résolution une rigueur qui n’existe pas dans le modèle, et l’on peut se contenter de définir un couple de bonnes stratégies , c’est-à-dire des stratégies qui, sans être optimales, assurent à chacun des deux joueurs une espérance relative voisine de la valeur du jeu. L’expérience de la situation réelle considérée et l’intuition du chercheur opérationnel peuvent guider dans la recherche de ces bonnes stratégies. Il suffit ensuite, pour les tester, de calculer les espérances relatives qu’elles assurent respectivement aux deux adversaires: celle du joueur du maximum est toujours au plus égale à celle du joueur du minimum, et l’intervalle qui les sépare comprend la valeur du jeu. Il est donc inutile de chercher mieux si la largeur de cet intervalle est du même ordre de grandeur que les erreurs vraisemblablement commises sur les utilités. Il existe d’ailleurs des méthodes de calcul approché qui permettent de faire subir à un couple de stratégies adverses une suite de modifications telles que la largeur de l’intervalle séparant les espérances relatives des deux joueurs tende vers zéro (ces espérances tendent alors vers la valeur du jeu).Notions sur la théorie du duel infiniLa base de la théorie du duel fini étant le théorème de von Neumann, il est intéressant de chercher à étendre ce théorème à des classes aussi larges que possible de duels infinis, c’est-à-dire de duels où l’un au moins des deux adversaires dispose d’une infinité de tactiques.La forme normale d’un duel tactique quelconque est constituée par trois éléments: deux ensembles E et F de tactiques respectivement offertes aux deux joueurs A et B, et un indicateur d’utilité numérique défini sur le produit cartésien E 憐 F.Un duel stratégique correspondant à ce duel tactique est défini par trois éléments: deux ensembles S et T de stratégies respectivement offertes aux deux joueurs A et B, ces stratégies étant des distributions de probabilité sur E et F (c’est-à-dire des mesures en probabilité définies sur une tribu, plus ou moins générale, de parties de E ou de F), et un indicateur d’utilité linéaire défini sur le produit cartésien S 憐 T par une opération de moyenne en probabilité effectuée sur l’indicateur du duel tactique.Dans un duel tactique ou stratégique quelconque, l’espérance du joueur du maximum A s’exprime par le supremum d’un infimum (qui est parfois un maximin), tandis que l’espérance du joueur du minimum B s’exprime par l’infimum d’un supremum (qui est parfois un minimax). Les extensions du théorème de von Neumann expriment que, pour certaines classes de duels tactiques ou stratégiques, les espérances des deux joueurs sont égales , et l’on dit alors que le jeu admet une valeur égale à cette espérance commune. Dans ces conditions, si les deux joueurs ont des tactiques ou des stratégies prudentes, celles-ci définissent des équilibres, tous équivalents et interchangeables, et sont dites optimales . Mais il se peut que les joueurs aient seulement des «stratégies prudentes à 﨎 près», si petit que soit le nombre positif 﨎: dans un jeu qui admet une valeur, ces stratégies sont dites optimales à 﨎 près . Et il se peut aussi qu’un duel tactique ou stratégique n’admette pas de valeur.On doit ici se borner à ces indications générales, en renvoyant aux ouvrages spécialisés pour les importants résultats auxquels conduit l’étude des duels infinis.4. Aperçus sur les jeux de lutte et de coopérationGénéralitésDès qu’un jeu laisse place en même temps à la lutte et à la coopération, c’est-à-dire dès qu’il ne s’agit plus d’un duel, il est difficile de le représenter, sans hypothèse ni condition supplémentaire, par un schéma de causalité et un schéma de finalité traduisant correctement les moyens d’action et les préférences des joueurs.Il est d’abord essentiel de préciser les conditions dans lesquelles peut s’exercer une éventuelle coopération entre les joueurs (même s’il n’y en a pas plus de deux), et en particulier les possibilités de formation et d’évolution des alliances , ainsi que les modalités de leur fonctionnement et les «paiements compensatoires» auxquels des joueurs alliés peuvent procéder en marge du jeu proprement dit. S’il est permis à certains joueurs de communiquer entre eux, il faut aussi préciser si tel ou tel de ces joueurs est libre de refuser cette possibilité (des considérations psychologiques peuvent l’y inciter si un point faible le rend vulnérable aux menaces de ses adversaires). Il y a là de véritables conditions sociologiques qu’il est indispensable d’introduire, sous une forme ou sous une autre, dans les modèles de jeux plus généraux que le duel.D’autre part, la mise en œuvre de la coopération présente le plus souvent un aspect dynamique dont il est difficile de rendre compte de façon satisfaisante dans un modèle global. Il est même possible que, toute communication entre les joueurs étant interdite, la coopération ne puisse s’exercer que par un véritable apprentissage mutuellement donné et reçu au cours du déroulement d’une partie, à travers l’enchaînement des décisions élémentaires des joueurs. Une telle forme tacite de coopération n’en joue pas moins un rôle important dans certains jeux séquentiels, et par exemple dans les «superjeux» constitués par certaines suites finies ou infinies de parties d’un même jeu.On comprend ainsi que la forme normale ne soit pas toujours le cadre le mieux adapté à l’étude des jeux de lutte et de coopération, et que de nombreux modèles puissent être proposés pour les représenter, selon les conditions sociologiques retenues, sans qu’il y ait lieu d’établir une hiérarchie entre ces modèles. Leur étude, souvent fort délicate, procède toujours plus ou moins directement des quatre principes déjà considérés: calculs d’espérance, considérations de dominance , recherche de l’équilibre , principe de récurrence , mais l’existence de possibilités de coopération complique la mise en œuvre de ces principes.Il est rare que cette étude puisse, comme celle du duel, conduire à considérer certaines manières de jouer comme optimales ou certains résultats isolés comme privilégiés. Mais on peut penser que le caractère plus nuancé et la structure plus complexe des «solutions» proposées pour les jeux de lutte et de coopération est «conforme à la nature des choses».Rationalité individuelle et rationalité collectiveQuel que soit le modèle adopté, l’étude d’un jeu de lutte et de coopération doit toujours prendre en considération deux éléments importants:– les espérances des différents joueurs , caractérisant les buts qu’ils sont sûrs de pouvoir atteindre (au moins à 﨎 près) par leurs seules forces, quoi que fassent les autres joueurs;– l’extremum de Pareto , qui est l’ensemble des résultats, dits extrêmes ou collectivement admissibles, qu’il est impossible d’améliorer pour un joueur sans qu’un autre au moins en pâtisse.On peut en effet penser que des joueurs individuellement rationnels ne sauraient se contenter d’un résultat ne leur assurant pas leur espérance, et que des joueurs collectivement rationnels devraient considérer comme inadmissible tout résultat non extrême. L’ensemble des résultats réalisables qui satisfont à la double condition de rationalité individuelle (ils assurent à chacun des joueurs au moins son espérance) et de rationalité collective (ils sont extrêmes) est une partie de l’extremum de Pareto: c’est ce que l’on appelle l’ensemble de négociation et, dans le cas particulier des problèmes de partage, l’ensemble des imputations .Malgré l’intérêt de l’ensemble de négociation, il ne faut pas oublier que des joueurs, même rationnels et libres de coopérer, peuvent éprouver de grandes difficultés à atteindre l’extremum et que la prudence peut les inciter à y renoncer quand une défiance mutuelle apparemment irrémédiable leur fait craindre l’«ascendant des intérêts particuliers». Pour atteindre à coup sûr un résultat extrême, les joueurs devraient en effet s’accorder, explicitement ou implicitement, pour jouer un «jeu sur l’extremum» (ou mieux sur l’ensemble de négociation) dont la règle ne résulte pas en général de celle du jeu proposé. Mais il se peut qu’un tel accord soit difficile à réaliser, et que son éventuelle réalisation sans garanties suffisantes fasse courir de grands risques à certains joueurs dont la loyauté pourrait être exploitée par des partenaires déloyaux. Il est même possible que chacun des joueurs ait personnellement intérêt à ne pas respecter l’accord, quoi que fassent par ailleurs les autres joueurs, mais que chacun ait grand intérêt à ce que l’accord soit respecté par les autres, et que tout le monde perde à ce que l’accord ne soit respecté par personne (le célèbre «dilemme des prisonniers» en donne un exemple classique). Dans de tels cas, la recherche individuelle des intérêts particuliers peut compromettre l’intérêt d’un ensemble de joueurs, en conduisant à des résultats collectivement irrationnels. Seule une coopération confiante (impliquant le respect des accords), ou un arbitrage accepté (parfois représenté par une contrainte sociale), permettrait de sortir de telles impasses et d’atteindre l’extremum, mais les conditions psychologiques ou sociologiques n’en sont pas toujours réunies.Certains théoriciens, tels que J. F. Nash et J. C. Harsanyi, ont cherché à définir des procédures d’arbitrage ou de marchandage sur l’ensemble de négociation, soit en s’appuyant sur des considérations de symétrie, d’invariance, de stabilité (plus ou moins fondées sur un certain désir d’équité), soit en s’efforçant de tenir compte de certains postulats de rationalité et des moyens de marchandage dont disposent les joueurs, en particulier de leurs possibilités mutuelles de menaces (ce qui peut imposer une délicate comparaison interindividuelle des utilités). D’autres théoriciens, comme von Neumann et Morgenstern, préfèrent s’en tenir à mettre en évidence le rôle privilégié de l’ensemble de négociation, ou de certains ensembles d’imputations qui y sont inclus, sans aller jusqu’à privilégier un résultat déterminé: cette dernière sélection, dépendant des aptitudes relatives des joueurs au marchandage , est alors considérée comme relevant de la psychologie plus que de l’analyse mathématique.À côté des conditions de rationalité individuelle et collective, on peut parfois considérer des conditions de rationalité interindividuelle relatives à certaines alliances et excluant les résultats qu’une telle alliance aurait le moyen d’améliorer pour l’un au moins de ses membres sans qu’aucun autre en pâtisse. Mais de telles conditions ne s’imposeraient que si leur violation devait à coup sûr entraîner la formation des alliances correspondantes en vue de les défendre. De plus, comme un joueur déterminé ne peut participer qu’à une seule alliance à la fois, il est naturel que les conditions de rationalité interindividuelle, écrites pour toutes les alliances, soient en général incompatibles. Cependant, quand toutes ces conditions sont compatibles, elles définissent une partie de l’ensemble de négociation que l’on appelle le cœur du jeu (core ).Esquisse de quelques modèlesOn donnera seulement ici quelques indications sur les principaux modèles qui ont été proposés pour représenter les jeux de lutte et de coopération, en supposant toujours que les joueurs soient en nombre fini n .1. Le modèle de Nash interdit toute communication, toute alliance, tout paiement compensatoire entre les joueurs. Ou plutôt Nash présente un tel modèle comme capable de rendre compte formellement de tout jeu de lutte et de coopération grâce à un élargissement adéquat des ensembles de tactiques offerts aux joueurs. Il est clair que la construction effective d’un tel modèle pour un jeu général risquerait de présenter d’insurmontables difficultés, mais rien n’empêche de considérer le modèle comme donné.Dans ces conditions, les n joueurs, privés par hypothèse de toute possibilité de corréler leurs manières de jouer, peuvent s’intéresser aux systèmes de tactiques ou de stratégies en équilibre, en même temps qu’à des considérations de prudence ou de dominance. Le théorème de Nash, qui est une extension du théorème de von Neumann, établit que, dans tout jeu stratégique où les n joueurs disposent d’un nombre fini de tactiques , il existe au moins un système de stratégies en équilibre . Mais, même dans le cas où il y a seulement deux joueurs, il peut exister plusieurs équilibres non équivalents et non interchangeables, et les systèmes de stratégies prudentes ne sont pas, en général, en équilibre. Cependant tout point d’équilibre donne à chacun des joueurs au moins son espérance.Il est alors difficile de tirer de la détermination des équilibres une «solution» du jeu, malgré les efforts effectués dans cette voie par Nash et par D. Gale à l’aide de considérations de dominance et de rationalité collective. Certaines considérations psychologiques, fondées sur les risques courus par les joueurs, peuvent parfois inciter à privilégier tel ou tel point d’équilibre, et Harsanyi a exploité ce principe pour proposer une solution générale des jeux de Nash finis.2. Le modèle des problèmes de partage de von Neumann et Morgenstern permet au contraire toute communication, toute alliance entre les joueurs, et suppose l’existence d’un bien indéfiniment divisible (analogue à une monnaie) dont l’échange entre les joueurs permet un transfert d’utilité entre eux, moyennant un choix convenable de leurs échelles d’utilité respectives. Cette hypothèse, qui précise les modalités des paiements compensatoires, ne suppose aucune comparaison interindividuelle des utilités. Mais elle permet de parler de l’utilité totale d’un résultat pour une alliance, et de la répartition de cette utilité entre les joueurs alliés. Un tel modèle peut donc être décrit comme représentant un problème de partage d’un certain bien – l’utilité globale disponible – entre n participants qui sont libres a priori de conclure entre eux les alliances de leur choix.Il reste à préciser les moyens d’action dont disposent les joueurs et toutes les alliances possibles, ce que l’on fait en général en donnant directement une fonction caractéristique , qui pourrait aussi se déduire de la forme normale du jeu. La fonction caractéristique est définie sur l’ensemble des parties de l’ensemble des n joueurs, et elle caractérise les revendications que chaque alliance pourrait soutenir efficacement si elle était constituée. L’hypothèse faite sur la transférabilité des utilités entre les joueurs permet ici de donner seulement, pour chaque alliance, l’utilité totale qu’elle peut s’assurer quoi que fassent les autres joueurs, c’est-à-dire son espérance dans un duel qui l’opposerait à tous les autres joueurs coalisés contre elle. La fonction caractéristique ainsi définie est sur-additive , en ce sens que l’union de deux alliances disjointes a une espérance au moins égale à la somme des espérances de ces deux alliances (mais certaines extensions de la théorie suppriment la condition de suradditivité). Bien que la fonction caractéristique ne suffise pas en général à rendre compte de tous les éléments d’un problème de partage, von Neumann et Morgenstern supposent qu’aucune autre donnée ne peut être exploitée.Les résultats extrêmes, au sens de Pareto, sont les partages sans reste de l’utilité globale disponible entre les n joueurs. Les partages sans reste qui donnent au moins son espérance à chacun des joueurs sont appelés les imputations . L’ensemble des imputations est ainsi l’ensemble des résultats qui satisfont à la double condition de rationalité individuelle et collective, et von Neumann et Morgenstern considèrent que le jeu se joue sur cet ensemble. S’il existe des imputations qui satisfassent à toutes les conditions de rationalité interindividuelle, imposant que chacune des alliances possibles reçoive au moins son espérance, elles constituent le cœur du jeu.On peut alors considérer qu’une imputation s exclut une imputation t si, et seulement si, il existe une alliance qui reçoive au plus son espérance dans s (de telle manière qu’elle puisse s’opposer à toute diminution de sa part si s est réalisée), et dont tous les membres perdraient au passage de s à t . Ces relations d’exclusion permettent de définir des ensembles privilégiés d’imputations, qui sont les «solutions » des problèmes de partage, au sens de von Neumann et Morgenstern: chacune de ces solutions est caractérisée par le fait qu’elle est stable intérieurement (pas d’exclusion entre imputations appartenant à une même solution) et stable extérieurement (pas d’imputation extérieure à une solution qui ne soit exclue par l’une au moins des imputations qui lui appartiennent). Le cœur du jeu, s’il n’est pas vide, fait manifestement partie de toute solution, mais il ne constitue pas en général une solution à lui tout seul.Une «solution» d’un problème de partage est ainsi un ensemble d’imputations qui peuvent être simultanément considérées comme réalisables, et dont les possibilités de réalisation excluent celle de toute autre imputation. Mais il n’est pas vrai que tout problème de partage admette au moins une solution (W. F. Lucas, 1968). Et l’on connaît beaucoup d’exemples de problèmes admettant un grand nombre ou une infinité de solutions, dont chacune peut à son tour comprendre un grand nombre ou une infinité d’imputations. Selon von Neumann et Morgenstern, ce sont des conditions sociologiques (standards of behavior ) qui commanderont alors le choix d’une solution parmi toutes les solutions possibles, et ce sont les aptitudes relatives des joueurs au marchandage (relative bargaining abilities ) qui entraîneront la réalisation d’une imputation parmi toutes celles de la solution choisie.En se plaçant à un point de vue très différent, L. S. Shapley a cherché à estimer la valeur que chaque joueur peut attribuer à l’éventualité de prendre part à un tel jeu de partage, défini par sa fonction caractéristique. Il est parvenu à montrer que des conditions de symétrie, de rationalité collective et d’additivité apparemment naturelles (mais, bien entendu, sujettes à critique) permettent de déterminer une telle valeur d’une manière unique. Cette fonction, définie sur l’ensemble des n joueurs, est appelée la valeur de Shapley . Elle définit d’ailleurs une imputation particulière, qui pourrait être proposée, dans certains cas, comme base d’un arbitrage.Malgré le caractère assez particulier des situations qu’il représente, le modèle de von Neumann et Morgenstern est, par les concepts originaux et profonds dont les auteurs l’ont enrichi, la base de nombreuses généralisations dans diverses voies et de fructueuses recherches relatives à l’économie des marchés. On citera seulement ici les travaux de L. S. Shapley, M. Shubik, R. J. Aumann et B. Peleg sur les jeux de lutte et de coopération sans paiements compensatoires , les travaux de G. Debreu et H. Scarf sur les équilibres concurrentiels et le cœur d’une économie , ainsi que leur extension par Aumann au cas des échanges entre une infinité continue de participants. Ces travaux sur l’économie des marchés montrent qu’il existe, dans certaines conditions, une convergence remarquable entre le point de vue individualiste de la concurrence parfaite (avec formation d’un système de prix selon la loi de l’offre et de la demande), et le point de vue coopératif du libre échange des biens entre les participants.3. Le modèle intermédiaire de Luce suppose que certains obstacles à la communication entre les joueurs restreignent les possibilités de formation de nouvelles alliances à partir de chaque «structure d’alliance» réalisable. Plus précisément, il existe une fonction 祥 qui, à chaque partition 精 de l’ensemble des n joueurs, associe une classe 祥( 精) d’alliances considérées comme seules admissibles à partir de la structure 精. Il faut, bien entendu, supposer que 精 est une partie de 祥( 精).On considère alors comme privilégiés les couples (x , 精), formés d’un résultat x et d’une structure d’alliance 精, qui possèdent la 祥-stabilité , en ce sens que le résultat x satisfait aux conditions de rationalité interindividuelle pour chacune des alliances de la classe 祥( 精) – ce qui empêche ces alliances de revendiquer efficacement plus qu’elles n’obtiennent dans le résultat x –, et qu’il satisfait aussi à des conditions de rationalité individuelle un peu renforcées: chaque joueur obtient dans x au moins son espérance, et même mieux que son espérance s’il participe à une véritable alliance (ce qui dissuade les joueurs de rompre les alliances auxquelles ils participent). On peut éventuellement ajouter à ces conditions la condition de rationalité collective.Un tel modèle peut être envisagé, soit avec une utilité transférable, soit en l’absence de tout paiement compensatoire. Il est possible, dans tous les cas, qu’il n’existe aucun couple 祥-stable, ou qu’il en existe plusieurs, ce qui entraîne d’évidentes difficultés pour fonder la résolution d’un jeu sur la 祥-stabilité.On voudrait avoir montré que la théorie des jeux est un ensemble cohérent, reposant sur quelques idées générales saines, exploitées avec un succès inégal, mais certain, dans l’étude de différents modèles de conflit, avec ou sans possibilités de coopération.Il reste la difficulté d’appliquer les résultats obtenus aux situations réelles de conflit, soit qu’il s’agisse de résultats relatifs à des modèles trop rudimentaires pour rendre compte d’une réalité complexe, soit qu’il s’agisse de résultats trop fragmentaires relatifs à des modèles dont la complexité rend l’étude délicate. Il ne faut certes pas oublier ces servitudes et vouloir tirer de la théorie des jeux plus qu’elle ne peut donner dans chaque problème concret. Mais il ne faut pas oublier non plus tout ce que peut apporter, pour la compréhension et le traitement d’un problème, la seule construction d’un modèle soigné, avec une réflexion méthodique sur ce modèle, ou aussi l’étude d’un modèle simplifié, et connu comme tel, mais rendant compte de certains aspects importants de la situation réelle.Il est sans doute permis de dire, en se référant à une expérience déjà significative, que la théorie des jeux apporte, dans certains cas, des éléments précis pour guider la décision et l’action des joueurs ou pour expliquer l’évolution d’une situation réelle de conflit, et qu’elle fournit, pour la plupart de ces situations, un cadre de pensée et des éléments de réflexion extrêmement fructueux.
Encyclopédie Universelle. 2012.